探索数据集

代码功能性

Criteria Meet Specification

代码是否正常运行?

所有代码均有用且运行时不会产生错误。所给代码足够重现描述的结果。

项目是否适当使用了 NumPy 和 Pandas?

项目在适当情况下使用 NumPy 数组和 Pandas Series
及 DataFrames,而非 Python 列表与字典。并在可能情况下使用向量运算和内置函数,而非循环。

项目是否使用良好的编码实践?

代码利用函数来避免重复代码。代码包含清晰的注释和变量名称,可读性较高。

代码的注释中并没有包含对于统计数字和可视化的推理说明。恰当地使用了Markdown格式。

分析质量

Criteria Meet Specification

项目是否清楚地提出了问题?

项目清楚地提出了一个或多个问题,然后在分析的其余部分解决了这些问题。

数据整理阶段

Criteria Meet Specification

是否对数据清理进行了良好的记录?

项目记录了为清理数据所做的所有变更,例如合并多个文件,处理丢失的值等。

探索阶段

Criteria Meet Specification

是否采用多种方式探索数据?

项目从多个角度调查所述问题。至少有三个变量使用单变量 (1d) 和多变量 (2d) 探索进行了调查。

是否存在多种相关可视化和统计汇总?

项目采用了多种可视化并展示了多项对比和趋势。分析中在进行与数据有关的推理时都会计算相关统计。
至少应创建两种图作为探索的部分。

结论阶段

Criteria Meet Specification

学员是否正确表明了结论只是暂时的?

分析结果在展示时明确说明了存在的任何限制。分析中没有涉及”因果性“的论述或暗示。

沟通阶段

Criteria Meet Specification

分析流程是否容易理解?

每个分析决策、图和统计汇总均提供了推理说明。

数据是否使用了适当的图和参数进行了可视化?

项目的可视化采用适当的方式描述数据,所用的图容易解读,具有坐标轴标记、单位、图例、图标题。

Tips to make your project standout:

你可以 在这里查看此评审标准的英文版本